A model for estimating human visual attention : the latest approch with a dynamic Bayesian network
نویسندگان
چکیده
ある与えられた画像や映像の中から「もの」を取り出 す物体検出、及びその「もの」に関する情報を提示する 物体認識は、パターン認識やコンピュータビジョンの研 究分野において非常に長い歴史を持つと共に、無数とも 言えるほどの数の研究がなされている、非常にホットな トピックの 1つである。特に、人間やその顔など、一部の 特定対象についての物体検出については、対象に関する 事前知識を有効かつ最大限に利用することで、すでに実 用に供する技術水準に到達している [1], [2]。しかし、対象 に関する制約のない一般の物体検出・認識については、対 象となる物体の種類が膨大であること、同一種類の物体 でも多様な要因により見た目が大きく変化することなど から、極めて解決が難しい問題として知られている [3]。 一方で、我々人間は、特に意識することなく日常的に、 様々な物体の検出や認識を行っている。例えば、図 1左に 示す画像を見ると、乗用車・標識・白線などの存在を即時 に検出できるだろう。このような機能の実現には、視覚的 注意 (visual attention) [5]と呼ばれる人間の視覚メカニ ズムが大きく関与していると考えられている。すなわち、 視覚的注意とは、目から入力されてくる信号の中から重 要と思われる情報を瞬時に判断して、効率的かつ選択的 に情報を獲得するためのメカニズムである。この視覚的 図 1: 顕著度に基づく視覚的注意のメカニズム。Ittiらの 計算モデル [4]により、左の入力画像から右の顕著度画像 が得られる。Ittiらは、顕著度画像の画素値が最大となる 箇所に注意が向けられる仕組みを仮定したが、この例か らも、必ずしもその仮定が真ではないことがわかる。
منابع مشابه
Estimating of Loss Human Life Caused Through Earthquake Employing Neural Network
As a matter of fact, the estimated loss of the human life caused by the earthquake is a crucial issue. This estimate helped to administrators in planning for the preventive measures or the crisis management after the earthquake. In this article, we represented a new model for measuring the loss of human life utilizing the self-organizing competitive neural networks. In the latest model, the neu...
متن کاملReceptive Field Encoding Model for Dynamic Natural Vision
Introduction: Encoding models are used to predict human brain activity in response to sensory stimuli. The purpose of these models is to explain how sensory information represent in the brain. Convolutional neural networks trained by images are capable of encoding magnetic resonance imaging data of humans viewing natural images. Considering the hemodynamic response function, these networks are ...
متن کاملA stochastic model of human visual attention with a dynamic Bayesian network
Recent studies in the field of human vision science suggest that the human responses to the stimuli on a visual display are non-deterministic. People may attend to different locations on the same visual input at the same time. Based on this knowledge, we propose a new stochastic model of visual attention by introducing a dynamic Bayesian network to predict the likelihood of where humans typical...
متن کاملJust Noticeable Difference Estimation Using Visual Saliency in Images
Due to some physiological and physical limitations in the brain and the eye, the human visual system (HVS) is unable to perceive some changes in the visual signal whose range is lower than a certain threshold so-called just-noticeable distortion (JND) threshold. Visual attention (VA) provides a mechanism for selection of particular aspects of a visual scene so as to reduce the computational loa...
متن کاملEstimating of Loss Human Life Caused Through Earthquake Employing Neural Network
As a matter of fact, the estimated loss of the human life caused by the earthquake is a crucial issue. This estimate helped to administrators in planning for the preventive measures or the crisis management after the earthquake. In this article, we represented a new model for measuring the loss of human life utilizing the self-organizing competitive neural networks. In the latest model, the neu...
متن کاملMultiple People: Wandering Visual Focus of Attention Estimation
The problem of finding the visual focus of attention of multiple people free to move in an uncons-trained manner is defined here as the wandering visual focus of attention (WVFOA) problem. Estimating the WVFOA for multiple unconstrained people is a new and important problem with implications for human behavior understanding and cognitive science, as well as real-world applications. One such app...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2010